iT邦幫忙

DAY 2
2

Data Mining 學習路:概念、技術與工具系列 第 2

Data Mining 學習路:Day 2 - 簡介 Data Mining 及相關領域

  • 分享至 

  • xImage
  •  

# 數據挖掘, 挖什麼?
在過去,小規模的資料分析只要靠人就可以做了,然而隨著網路的發展以及資料儲存技術的提升,資料越來越多,慢慢出現那種資料量大到無法以人工的方式來進行分析的情形,於是透過電腦、統計以及其他分析技術讓人們能在合理的時間內一次分析大量資料的手段就出現了,也衍生出現在很流行的所謂 Big Data 的概念。

現實生活中的資料,隱藏著許許多多對我們的生活或科學研究上有價值的訊息,例如現在很流行的社群網站,我們可以從人們在社群網站中的各種行為來分析出人們的行為模式,進而轉換成商業或更多領域的價值。

然而想要掌控海量的資料,就需要有相應的技術與工具,其中一個就是 data mining。

簡單來說,data mining 就是在龐大的資料海中淘金,從現有的資料之中,透過各種方式分析、挖掘出某些規則,或過濾出某些特定的訊息,最後轉化成我們所需要的資訊。

Data mining 的技術其實是大雜燴,由很多其他領域的東西相互交流組合,包括統計、機器學習以及人工智慧等等等。

統計分析(Statistical Analysis)

統計應該算是一個很古老的學科吧(相較於各種電腦科技來說...),統計的概念在於如何測定、收集、整理、歸納和分析,最後反映出資料現象,其實也可以說他是 data mining 的根基也不為過,有了統計工具,我們才知道該怎麼樣去對資料做處理和展現。

機器學習(Machine Learning)

機器學習就很有趣了,究竟「機器」怎麼樣學習呢?其實他指的是讓機器能自動去分析數據,發現數據中的規律,並進行預測的一種技術,白話一點就是透過分析現有的資料,然後讓他去「猜」其他的可能,機器學習同樣的也包含了很多很多不同領域的學科,統計啦機率啦演算法啦等等等,不過這個系列不是要討論機器學習這個領域,所以知道有這個東西就好

人工智慧(Artificial Intelligence, AI)

AI 這東西就更複雜了。
說到人工智慧應該很多人想到的是機器人吧 w
一個很通俗也比較容易理解的講法是說,AI 是如何讓機器能夠模擬人的智能的技術,它讓機器能夠擁有學習、推理以及解決問題等能力,當然 AI 也包含了機器學習、統計及資料挖掘的概念。由於我們不是要講 AI,所以也是知道有這個東西就好,有興趣的請參考下方連結 or Google XD。

未來我主要會寫一些我在讀 data mining 時學到的一些東西,文章其實比較像讀書筆記,介紹的概念會比較偏向應用面,而不會太深究於原理的部分(例如公式證明這類東西)。

我主要學習的書是 Ian H. Witten, Eibe Frank, Mark A. Hall 合著的 Data Mining: Practical Machine Learning Tools and Techniques,這本書寫的還滿好懂的,有興趣的人可以去看看

參考資料

[資料探勘真的跟你想的不一樣](http://www.circle.tw/trend/data-mining-think-different.html)
[wikipedia 大數據](http://zh.wikipedia.org/wiki/%E5%A4%A7%E6%95%B8%E6%93%9A)
[什麼是機器學習(Machine Learning)?](http://tzanfeng.pixnet.net/blog/post/25614373-%E4%BB%80%E9%BA%BC%E6%98%AF%E6%A9%9F%E5%99%A8%E5%AD%B8%E7%BF%92%28machine-learning%29%3F)
[wikipedia 人工智慧](http://zh.wikipedia.org/wiki/%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD)


上一篇
Data Mining 學習路:Day 1 - 前言
下一篇
Data Mining 學習路:Day 3 - Data Mining 的應用實例
系列文
Data Mining 學習路:概念、技術與工具16
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言